#entornos domésticos

SMH-Bench: Evaluando el razonamiento de LLM en hogares inteligentes

SMH-Bench evalúa agentes LLM en hogares inteligentes con 1100 tareas. ¿Son capaces de razonar y automatizar? Descúbrelo.